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摘要 : 【 目的 ] 通过 分 析 美 国 一 流 大 学 图 书馆 网 站 导航 文本 的 特点 ,为 国内 大 学 图 书馆 导航 建设 提供 建议 【方法 】 
结合 一 流 大 学 应 具有 一 流 学 科 、 一 流 教师 和 一 流 学 生 的 思路 选取 选取 15 所 美国 一 流 大 学 图 书馆 ， 基 于 标签 云 和 
文本 挖掘 模型 VSM， 分 析 导 航 文本 词 维度 上 的 共性 和 特异 性 , 并 结合 《2016 年 美国 图 书馆 状况 报告 》 进 行 数据 


验证 。[ 结果 ] 与 人 工 调研 相 比 ,基于 VSM 模型 的 统计 方法 可 以 更 直观 、 快 速 地 给 出 基础 调研 结 


， 调 研 结 果 可 


供 进一步 深度 文本 分 析 参 考 。[ 局 限 ] 仅 选取 一 级 导航 、 二 级 导航 和 首页 标题 板块 概况 导航 文本 。[ 结论 】 基 于 
文本 数据 挖掘 模 型 的 统计 方法 可 以 更 直观 、 快 速 地 给 出 基础 调研 结果 ,为 高 校 图 书馆 网 站 导航 建设 提供 参考 。 
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1 3 引 


互联 网 时 代 , 图 书馆 网 站 转变 为 图 书馆 内 容 展 示 
和 服务 的 主要 窗口 , 通过 图 书馆 网 站 获取 信息 已 成 为 
用 户 利用 图 书馆 资源 的 一 种 基本 方式 。 随 着 近年 图 书 
馆 信息 资源 量 和 服务 内 容 的 增加 ,包括 提 供 文献 资 
源 、 提 供 图 书馆 服务 介绍 信息 、 提 供 图 书馆 消息 、 促 
进 与 读者 的 交流 互动 等 , 图 书馆 网 站 要 承载 的 内 容 远 
远 超出 了 原 有 的 限度 。 而 用 户 的 需求 也 日 趋 多 样 化 ， 
要 能 够 在 图 书馆 网 站 以 最 快 的 速度 找到 自己 所 需要 的 
东西 ， 由 于 图 书馆 网 站 所 承载 的 内 容 有 限 ， 且 往往 有 
很 多 相对 独立 的 资源 管理 系统 与 服务 模块 ， 这 势必 会 
造成 相当 多 的 内 容 被 隐藏 ， 图 书馆 服务 无 法 更 好 地 为 
读者 所 用 , 读者 也 无 法 知道 图 书馆 还 有 哪些 服务 。 在 
这 种 情况 下 ,作为 提供 给 用 户 的 最 直接 、 最 方便 的 网 
站 内 容 访 问 工具 ,图 书馆 网 站 导航 就 变 得 非常 有 意义 ， 
而 且 伴 随 着 信息 超载 , 这 种 导航 将 越 来 越 有 意义 。 图 
书馆 网 站 导航 主要 指 位 于 网 页 页 眉 区 域 的 ,在 页 眉 横 
局 图 片上 边 或 下 边 的 一 排水 平 导航 文字 ， 它 起 着 链接 
图 书馆 网 站 的 各 个 页 面 的 作用 。 男 外 ,考虑 到 首页 亦 


了 中 


可 提供 一 个 简便 快捷 的 操作 入 口 , 帮助 用 户 快 速 定位 


到 所 需要 的 资源 , 图 书馆 首页 各 个 栏目 的 标题 也 应 该 
纳入 网 书馆 导航 的 范畴 。 


图 书馆 网 站 应 完善 导航 功能 有 针对 性 地 把 物理 
上 分 散 的 、 杂 乱 无 章 的 信息 资源 重新 组 织 , 使 网 络 用 
户 能 够 快捷 地 找到 自己 所 需要 的 信息 趾 。 国 内 著名 大 
学 在 建设 图 书馆 网 站 时 ,大 多 参考 了 国外 著名 大 学 的 
书馆 网 站 。 以 清华 大 学 图 书馆 为 例 , 其 在 改版 时 将 
书馆 网 站 的 信息 和 资源 的 组 织 、 揭 示 与 布局 作为 重 
要 课题 ， 并 参考 了 国外 著名 大 学 图 书馆 网 站 中 1。 但 是 
国内 著名 大 学 图 书馆 大 多 重点 描述 了 参考 国外 大 学 图 
书馆 网 站 之 后 的 实施 , 没有 对 导航 调研 方法 进行 描述 
和 分 析 。 因 此 , 本 文选 取 15 所 美国 一 流 大 学 图 书馆 的 
导航 文本 , 借助 向 量 空间 模型 VSM 进行 研究 ， 以 期 为 
国内 图 书馆 网 站 导航 建设 提供 参考 。 


2 美国 一 流 大 学 图 书馆 导航 文本 分 析 


2.1 数据 收集 
按照 一 流 大 学 应 具有 一 流 学 科 、 一 流 教师 和 一 流 
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学 生 的 思路 选取 10 所 美国 一 流 大 学 扇 。 另 外 , 考虑 到 


标签 云 是 一 套 相 关 的 标签 以 及 与 此 相应 的 权重 。 


美国 大 学 图 书馆 显著 的 社会 服务 特点 ， 为 考察 图 书包 
的 社会 服务 , 在 10 所 大 学 的 基础 上 ,又 增加 了 5 所 大 
学 让。 最 终 选 取 的 15 所 大 学 图 书馆 分 别 为 : 哈佛 大 学 
图 书馆 、 斯 坦 福 大 学 图 书馆 、 麻 省 理工 学 院 图 书馆 、 
耶鲁 大 学 图 书馆 、 普 林 斯 顿 大 学 图 书馆 、 哥 伦比 亚 大 
学 图 书馆 、 芝 加 哥 大 学 图 书馆 、 加 州 理工 学 院 图 书馆 、 
宾夕法尼亚 大 学 图 书馆 、 加 州 大 学 伯克利 分 校 图 书馆 、 
康 奈 尔 大 学 图 书馆 、 加 州 大 学 戴 维 斯 图 书馆 、 田 纳西 
大 学 图 书馆 、 北 卡 罗 莱 纳 州 立 大 学 图 书馆 以 及 西北 大 
学 图 书馆 。 

在 Peter Morville 提出 的 用 户 体验 蜂 梨 模型 (User 
Experience Honeycomb) 中 ,可 寻 性 是 用 户 体验 的 主要 
指标 之 一 ,主要 通过 导航 与 定位 体现 四。 依据 其 理论 ， 
一 级 导航 、 二 级 导航 和 首页 板块 标题 可 以 代表 一 个 网 
站 内 容 的 主要 导航 组 织 方 式 ， 因此, 本文 选取 一 级 导 
航 、 二 级 导航 和 首页 板块 标题 文本 作为 分 析 对 象 。 

首先 人 工 收 集 这 15 所 大 学 图 书馆 的 一 级 导航 、 
二 级 导航 和 首页 板块 标题 ,并 进一步 根据 导航 文字 的 
语义 进行 归 一 化 处 理 ， 即 清洗 和 转换 工作 。 例 如 ， 
“About”、“ABOUT”、 “About us” 和 “About the library”， 
经 统一 大 小 写 和 文本 替换 工作 后 ,统一 文字 为 “about 
us”; “Help” 和 “Get Help” 统 一 为 "get help”; 拆 分 并 列 词 
组 ， 把 “Search && Find” 拆 分 为 两 个 词 条 “search” 和 
“find”， 把 “tools for prospective students| current 
students|faculty or stafflalumni or friends” 拆 分 为 “tools 


for prospective students” 、“tools for current students”、 
“tools for faculty or staff? 和 “tools for alumni or 
friends”。 针 对 不 同 层次 的 分 析 目 标 , 提供 一 级 导航 文 
字 统 计 分 析 、 首 页 板块 统计 分 析 和 导航 文字 在 导航 词 
维度 上 的 统计 分 析 。 
2.2 文本 统计 分 析 方 法 

在 对 文本 进行 统计 分 析 时 ， 主要 考察 文本 的 特性 
以 及 文本 与 文本 之 间 的 相似 性 。 为 了 更 清晰 地 对 导航 
文本 进行 解析 ,本 文 首先 利用 标签 云 对 导航 文本 整体 
进行 直观 描绘 , 之 后 , 通过 统计 方法 对 文本 进行 特征 
抽取 ,用 于 表征 各 个 文本 的 特性 , 并 进一步 在 文本 表 
征 的 基础 上 进行 文本 相似 度 计算 , 挖掘 文本 和 文本 之 
间 隐 含 的 相似 性 ,每 个 文本 的 特征 向 量 可 通过 降 维 人 处 理 
并 打印 , 形成 文本 的 摘要 信息 , 供 特 性 分 析 使 用 。 


权重 影响 使 用 的 字体 大 小 或 其 他 视觉 效果 。 标 签字 体 
越 大 ,此 条 目 在 网 站 中 出 现 的 次 数 越 多 。 标 签 云 在 直 
观 展示 网 站 的 显著 内 容 时 十 分 适用 , 可 用 于 各 个 网 站 
导航 之 间 的 共性 分 析 。 通 常 典 型 的 标签 去 有 30 至 150 
个 标签 ， 当 文本 较 多 时 , 标签 云 的 直观 性 会 降低 。 

本 文采 用 的 文本 相似 性 计算 方法 为 较为 经 盟 的 向 
量 空间 模型 (Vector Space Model VSM)。VSM 将 对 文 
本 内 容 的 处 理 简化 为 向 量 空间 中 的 向 量 运算 , 并且 它 
以 空间 上 的 相似 度 表 达 语 义 的 相似 度 中 ,其 中 ,导航 文 
本 的 相似 度 通过 两 个 多 维 向量 的 夹 角 的 余弦 值 来 表 
正 。 两 个 向 量 的 夹 角 越 小 , 余弦 值 越 高 ,代表 导航 文本 
之 间 相 似 度 越 高 。 

具体 而 言 , 假设 有 M 个 导航 文本 ,对 每 个 导航 
文本 进行 特征 提取 ,假设 特征 为 N 维 , 可 以 得 到 
MxN 的 特征 向 量 矩 阵 已 将 其 映射 到 VSM 模型 中 ， 
可 以 得 出 M 个 文本 中 任意 两 个 文本 的 特征 距离 。 本 
文采 用 向 量 的 余弦 距离 作为 它们 之 间 的 语义 距离 。 假 
设 有 导航 文本 A 和 导航 文本 B, 则 它们 的 语义 距离 如 
公式 (1) 所 示 。 


=、 


N 
4 和 
dis(A,B)=cos| 一 一 一 -|=cos 所 (1) 
141:1B| 已 2 四 2 
Da .> pb 


i 这 

本 文选 择 TF-IDF(Term Frequency-Inverse Document 
Frequency) 方 法 。TF-IDF 的 主要 思想 是 : 如 果 某 个 词 
或 短语 在 一 个 文本 中 出 现 的 频率 高 , 并 且 在 其 他 文本 
中 很 少 出 现 , 则 认为 此 词 或 者 短语 具有 很 好 的 类 别 区 
分 能 力 。 

VSM 处 理 的 文本 需要 分 词 、 去 停 用 词 等 操作 , 考 
虑 到 导航 文字 中 词 条 和 词 条 之 间 有 明显 物理 间隔 , 本 
文 把 一 组 导航 词 作 为 一 个 词组 进行 处 理 , 首先 对 词组 
进行 归 一 化 预 处 理 , 并 计算 每 个 词组 的 TF-IDF 值 , 由 
此 , 各 个 网 站 内 容 的 表示 形式 转换 为 词组 的 TF-IDF 
值 向 量 ， 基 于 该 向 量 进行 相似 度 计算 并 选取 相似 度 阔 
值 ， 挖掘 各 个 导航 文本 之 间 潜 在 的 关联 , 并 选取 各 导 
航 文本 TF-IDF 值 最 高 的 10 维特 征 , 打印 为 导航 文本 
的 关键 词组 , 分 析 各 个 网 站 导航 的 特性 。 
2.3 ”结果 分 析 

首先 利用 标签 云 分 别 直 观 展示 一 级 导航 文字 共性 
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和 首页 板块 标题 的 共性 。 之 后 , 为 进一步 探索 具体 导 
航 文本 之 间 的 相似 性 , 利用 VSM 对 每 个 网 站 的 导航 
文字 , 包括 一 级 导航 文字 、 二 级 导航 文字 、 首 页 板块 
标题 文字 ,进行 语义 相似 度 分 析 , 并 打印 出 各 个 大 学 
图 书馆 导航 文本 的 特征 向 量 , 结合 《2016 年 美国 图 书 
馆 状 况 报告 》 外 进行 分 析 。 

(1) 导航 直观 共性 分 析 

在 对 导航 词 进行 预 处 理 之 后 , 对 15 所 一 流 大 学 图 
书馆 的 一 级 导航 文字 进行 汇总 ， 导 和 人 开源 标签 云 生 成 
器 TAGULM 中 ,生成 一 级 导航 标签 云 , 如 图 1 所 示 。 可 
见 , 美国 一 流 大 学 网 站 中 ,关于 我 们 (about us)、 研 究 文 
持 (research support)、 服 务 (services)、 帮 助 (get help)、 数 
据 集 (collections)、 图 书馆 们 (libraries)、 人 研究 (research)、 
检索 (search) 和 寻找 (find) 占 据 了 显著 位 置 , 说 明 这 些 导 
航 词 在 各 大 学 图 书馆 一 级 导航 中 出 现 的 频率 较 高 。 
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图 1 美国 15 所 一 流 大 学 图 书馆 一 级 导航 标签 云 


同样 ,利用 首页 板块 标题 文字 生成 首页 板块 标题 
标签 云 如 图 2 所 示 , 新 闻 (news)、 检索 (search)、 发 现 
(find)、 活 动 (events) 模 块 是 比较 通用 的 模块 。 
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图 2 美国 15 所 一 流 大 学 图 书馆 首页 板块 标题 
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(2) 基于 VSM 的 导航 共性 分 析 

基于 VSM 的 网 站 余弦 相似 度 计 算 结 果 表 明 , 各 
个 网 站 之 间 的 相似 度 偏 低 ( 均 低 于 0.30)。 说 明 各 个 大 
学 图 书馆 在 建设 网 站 导航 时 ,并 不 存在 过 度 借鉴 现象 ， 
这 与 实际 情况 相符 合 , 也 说 明了 本 文选 取 的 文本 相似 
度 计算 方法 的 可 靠 性 。 同 时 ,如 导航 文本 直观 共性 分 
析 所 示 ， 有 些 导航 词 会 在 多 个 大 学 图 书馆 导航 中 出 现 ， 
为 了 进一步 探索 网 站 之 间 的 共性 , 选 定 相似 度 靖 值 
0.20, 发 现 7 对 组 合 存在 弱 相 似 性 , 为 了 直观 表示 , 用 
实 线 关联 具有 一 定 相似 性 的 高 校 ， 如 图 3 所 示 , 哈佛 
大 学 图 书馆 与 斯 坦 福 大 学 图 书馆 、 麻 省 理工 学 院 图 书 
馆 等 具有 一 定 的 弱 相 似 性 ,从 打印 的 特征 表示 向 量 中 
可 以 看 出 , 图 书馆 们 dibraries)、 活 动 (events) 和 员工 目 
录 (staff directory) 等 导航 词 对 相似 度 值 有 一 定 贡献 。 


图 3 与 哈佛 大 学 图 书馆 具有 弱 相 关 性 的 
6 所 大 学 图 书馆 及 相似 度 


(3) 基于 VSM 的 导航 特性 分 析 

为 了 进一步 考察 各 个 大 学 导航 文本 的 特性 ， 本 文 
打印 了 各 个 大 学 的 导航 词组 特征 向 量 , 按照 词 的 
TF-IDF 值 从 高 到 低 的 顺序 , 选取 排序 前 10 位 的 特征 
词组 进行 人 工分 析 , 如 表 1 所 示 。 

共性 (将 超过 1/3 大 学 存在 的 特征 词 作为 共性 ): 在 
15 所 大 学 中 , 有 11 所 大 学 把 图 书馆 们 (libraries) 作 为 重 
点 展示 对 象 , 其 中 , 有 10 所 大 学 的 第 一 位 特征 词 均 为 
图 书馆 ; 7 所 大 学 中 检索 (searcm 相 关 特 征 词 显著 ; 6 所 
大 学 有 研究 指南 特征 词 (guides); 6 所 大 学 有 活动 通知 
(events)， 其 中 有 2 处 显示 为 news and events; 6 所 大 学 
显著 提供 了 员工 指南 (staff directory); 5 所 大 学 有 关于 
我 们 (about us) 特 征 词 。 通 过 这 些 共 性 导航 词 ,不 难 发 
现 , 一 流 大 学 图 书馆 大 多 把 展示 资源 (图 书馆 、 员 工 、 
关于 我 们 ) 和 服务 (检索 、 研 究 指 南 ) 放 在 显著 位 置 。 与 


se 
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CR 1 15 所 一 流 大 学 图 书馆 Top10 导航 文字 
ey Top10 导航 文字 


libraries, access for persons with limited mobility, jobs, collecting areas, events, computing(equipment & 


services), privileges, search tools, chat, course guides 


faq for instructors, research data management services, equipment, computing, how to submit course reserves, 


康 夺 尔 大 学 
奈 尔 大 学 2 ; 
Te library spaces, help, search tips: catalog, research guides, search 
libraries, guide to using Special collections, get it @yale (borrow direct, interlibrary loan, scan & deliver), find 
耶鲁 大 学 ejournals by title, search worldcat, policies, elischolar, search, search library catalog (orbis), services for persons 
with disabilities 
二 recommend a title for purchase, deposit your research, technology, borrow direct, interlibrary loan, computing, 
哥伦比亚 大 学 Bi 


policies, butler library lockers, room reservation, study spaces 


libraries, hours and maps, reserve a study room, news and events, renew, staff directory, research help, how to 
加 州 大 学 伯克利 分 校 eb M ” ? 
find, online exhibits, about us 

libraries, copyright info, borrowdirect, employment, database finder, chapters, privileges, other local collections, 


research centers, library surveys 


libraries, google scholar, interlibrary loan, staff directory, filmfinder, tours, search, give to the library, course 


北 卡 罗莱 纳 州立 大 学 


reserves, visitor information 


libraries, resources, contact the library, tools for alumni, events, interlibrary loan, search tools, visit, guides, 


tools for graduate students 


libraries, today’s hours, borrow direct, study spaces and lockers, news and events, recommend a purchase, staff 
directory, new catalog, about us, research guides 


publish on demand, site map, archives, how do i...?, caltech open access policy faq, software available, about us, 
i ask a librarian, friends of the caltech libraries, copyright support 


CN libraries, initiatives, archives, contribute your research, events, e-resources, resources for alumni, departments, 


丛 佛 大 学 3 
staff directory, get it services 
| 纳西 大 六 ut dissertations, employment, give to the libraries, the library society, staff directory, libraries a-z, renew items, 
有 sh 和 和 
citing sources, music library, research guides 
libraries, resources, penn’s libraries, create a video, staff directory, subjects/collections, tools, tutorials for tools, 
宾夕法尼亚 大 学 Ws 
search, digitalpenn 
2 i scholarly publishing, galleries, tip faq, events, use policy, more search options, your account, about us, citation 
麻 省 理工 学 院 


ud software, study spaces 


libraries, melvyl, request a book/article, subject guides, digital scholarship, engineering, borrowing/circulation, 
加 州 大 学 戴 维 斯 分 校 ea 2 人 8 


carlson health sciences, about us, exhibits 


国内 大 学 不 同 的 是 , 这 15 所 一 流 大 学 图 书馆 大 多 把 活 ”重大 学 图 书馆 的 特色 一 一 Orbis 在 线 图 书馆 目录 系统 (Online 


动 通知 与 新 闻 分 开展 示 , 并 且 把 活动 通知 放 在 更 显著 。 “Library Catalog) 也 出 现在 特征 向 量 中 。 
的 位 置 @ 哈 佛 大 学 图 书馆 和 西北 大 学 图 书馆 分 别 有 显 著 的 为 
加 校友 提供 的 信息 ， 其 中 , 哈佛 大 学 体现 在 第 8 位 特征 词 ， 西 
通过 观察 表 1 中 的 各 网 站 导航 的 前 10 维特 征 向 。 ”北大 学 为 第 4 位。 
量 , 本 文 总 结 了 其 体现 的 部 分 特色 服务 ， 如下: @ 加 州 大 学 戴 维 斯 分 校 图 书馆 (UC Davis) 的 在 线 图 书馆 
四 斯坦福 大 学 图 书馆 的 特征 向 量 中 ,位 列 第 2 的 特征 词 目录 系统 Melvyl 体现 在 了 第 2 位 。 另 外 , 第 8 位 特征 词 
(组 ) 为 "access for persons with limited mobility”， 展 示 了 该 网 (carlson health a 医疗 健康 相关 特色 数据 。 


站 对 残疾 人 的 支持 服务 ; 位 列 第 6 的 特征 词 : computing 回 麻 省 理工 学 院 图 书馆 的 学 术 出 版 服务 (scholarly 
(equipment & services) 展 示 了 其 对 计算 相关 服务 的 支持 。 publishing) 位 列 特征 向 量 的 第 1 位 。 
加 那 得 大 学 图 书馆 ,与 斯 坦 福 大 学 类 似 ， 对 残疾 人 的 服 这 些 特征 向 量 表 明 , 各 大 学 图 书馆 均 有 其 服务 侧 


务 也 有 所 体现 (services for persons with disabilities)。 另 外 ， 慎 重点 , 可 满足 不 同 用 户 不同 领 域 的 技术 需求 , 例如 斯 
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坦 福 大 学 的 计算 相关 服务 、 耶 鲁 大 学 的 Orbis 在 线 图 
书馆 目录 系统 、 普 林 斯 顿 大 学 的 新 目录 系统 、 加 州 大 
学 戴 维 斯 分 校 的 Melvyl 在 线 图 书馆 目录 系统 、 加 州 大 
学 戴 维 斯 分 校 的 医疗 健康 相关 数据 、 麻 省 理工 学 院 的 
学 术 出 版 服务 等 。 另 外 , 各 个 大 学 图 书馆 在 开展 社会 
服务 方面 各 有 特色 , 包括 残疾 人 服务 和 校友 服务 等 。 
以 上 结果 也 印证 了 《2016 年 美国 图 书馆 状况 报告 》 中 
的 表述 : 图 书馆 在 积极 开展 服务 转型 以 满足 用 户 技术 
需求 由。 


此 外 ,上 述 报告 中 也 提 到 ,调查 表明 学 生 和 教 职 
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(2) 在 建设 导航 过 程 中 , 应 避免 过 度 借鉴 现象 ， 
一 方面 在 导航 词 中 加 入 图 书馆 特色 元 素 , 例如 ， 如果 
图 书馆 有 特色 编目 ,可 在 编目 导航 词 中 加 入 特色 编目 
简称 。 男 一 方面 可 以 参考 国外 大 学 , 在 导航 中 区 分 用 
户 类 别 , 例如 残疾 人 、 校友、 学 生 等 。 更 重要 的 是 , 应 
顺应 时 代 发 展 的 要 求 , 重点 拓展 特色 服务 , 包括 社会 
服务 , 激励 学 生 创新 的 技术 服务 等 。 


本 文 以 15 所 美国 一 流 大 学 图 书馆 的 网 站 导航 文 


工 认 可 大 学 图 书馆 在 展示 研究 技术 、 增 强 学 生 读 写 能 
力 和 管理 课程 资源 等 方面 的 价值 。 大 学 图 书馆 正在 通 
过 科技 界 和 数字 化 学 术 中 心 探寻 激励 学 生成 功 的 创新 
方法 四。 以 上 内 容 在 本 文 的 数据 中 也 能 找到 对 应 的 数 
据 支 持 。 人 研究 技术 (research techniques): 所 有 大 学 图 书 
馆 均 有 涉及 , 具体 体现 为 帮助 、 指 南 、 目 录 、 检 索 和 
发 现 等 ; 管理 课程 资源 (course reserves): 康 奈 尔 大 学 
(第 5 位)、 北 卡 罗 莱 纳 州 立 大 学 (第 9 位 )、 斯 坦 福 大 学 
(第 10 位 ); 科技 界 (publishing on demand): 加 州 理工 学 
院 (第 1 位 )、 麻 省 理工 学 院 ( 第 1 位 ); 数字 化 学 术 中 心 
(digital scholarship): 加 州 大 学 戴 维 斯 分 校 (第 5 位 )。 
总 之 ,通过 特征 向 量 ,可 以 迅速 了 解 各 大 学 图 书 
馆 导 航 文本 之 间 的 共性 和 特异 性 ,并 进一步 为 解析 图 
书馆 当前 重点 以 及 发 展 方向 提供 数据 基础 。 需 要 注意 
的 是 , 特征 向 量 表示 的 是 网 站 导航 的 代表 性 文本 而 非 
全 部 文本 ,例如 , 完整 的 网 站 导航 文本 中 ,除了 斯 坦 福 
大 学 和 耶鲁 大 学 、 北 卡 罗 莱 纳 州 立 大 学 、 加 州 大 学 
伯克利 分 校 、 哥 伦比 亚 大 学 、 康 奈 尔 大 学 等 均 有 提 
及 残疾 人 相关 服务 , 但 是 只 有 前 者 体现 在 Top10 导 
航 文字 中 。 
2.4 对 国内 高 校 图 书馆 网 站 导航 建设 的 启示 
调研 结果 对 国内 高 校 图 书馆 网 站 导航 建设 有 如 下 


启示 : 
(1) 各 个 大 学 图 书馆 在 建设 网 站 导航 时 ,可 应 用 
但 不 仅 限于 以 下 共性 导航 词 : 一 级 导航 词 可 以 考虑 选 
取 关 于 我 们 、 研 究 支 持 、 服 务 、 帮 助 、 数 据 集 、 图 书 
馆 们 、 研 究 、 检 索 和 寻找 等 共性 导航 词 ; 在 首页 板块 
中 , 可 以 选取 新 闻 、 检 索 、 发 现 和 活动 等 共性 板块 ; 在 
整个 导航 文本 中 ,图 书馆 们 、 检 索 、 人 研究 指南 、 活 动 、 
员工 目录 和 关于 我 们 具有 一 定 的 普遍 性 ,可 供 选 取 。 
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字 作 为 调研 对 象 , 基于 VSM 模型 对 导航 文本 进行 导 
航 词 维度 上 的 统计 ， 直 观 展示 了 各 网 站 导航 的 共性 和 
特异 性 , 并 结合 《2016 年 美国 图 书馆 状况 报告 》 进 行 
数据 验证 。 通 过 分 析 发 现 : 

一 级 导航 文本 中 ,多 数 图 书馆 重点 在 于 展示 其 资 
源 和 服务 , 包括 关于 我 们 、 研 究 支 持 、 服 务 、 帮 助 、 
数据 集 、 图 书馆 们 、 研 究 、 检 索 和 寻找 等 ; 在 首页 板 
块 中 , 新 闻 和 事件 、 检 索 和 快速 链接 模块 是 比较 通用 
的 模块 。 

网 站 整体 导航 文本 之 间 的 相似 度 偏 低 , 各 个 网 站 
的 特性 向 量 有 显著 差异 , 在 给 定 相似 度 阔 值 的 条 件 下 ， 
只 有 哈佛 大 学 图 书馆 与 斯 坦 福 大 学 图 书馆 、 麻 省 理工 
学 院 图 书馆 等 6 所 大 学 图 书馆 具有 一 定 的 弱 相 似 性 ; 
图 书馆 们 、 检 索 、 研 究 指 南 、 活 动 、 员 工 目 录 和 关于 
我 们 等 特征 词 具 有 一 定 的 普遍 性 ; 从 各 个 特征 向 量 中 ， 
可 以 找到 以 残疾 人 服务 为 例 的 相关 社会 服务 特征 词 ， 
并 有 特征 词 与 42016 年 美国 图 书馆 状况 报告 》 中 关于 
高 校 图 书馆 的 现状 描述 相 呼 应 。 

结果 表明 , 较 人 工 调研 方法 ,基于 文本 数据 挖掘 
模型 的 统计 方法 可 以 更 直观 、 快 速 地 给 出 各 个 图 书馆 
网 站 导航 的 共性 和 特异 性 的 直观 分 析 结 果 , 可 供 国内 
建设 一 流 大 学 图 书馆 网 站 参考 。 
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Abstract: [Objective] This paper studies the navigation features of top academic library websites from the United 
States, aiming to improve the services of their Chinese counterparts. [Methods] First, we identified library websites of 
the top 15 U.S. universities and downloaded their navigation texts. Second, we analyzed the similarities and differences 
among these texts with tag cloud and Vector Space Model. Finally, we examined our findings with the “2016 State of 
America’s Libraries Report”. [Results] The proposed method was intuitive and generated analysis results fast, which 
could be further processed with text mining techniques. [Limitations] Only retrieved the first and, second levels of 
navigation as well as titles of the homepages. [Conclusions] The proposed model provides useful information for the 
academic libraries in China. 
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